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r,pne des 1-Desoxv-D-xvlulose-Biosvntheseweqs 

Die vorliegende Erfindung betrifft DNA-Sequenzen, die bei Inte- 
gration in das Genom von Viren, Eukaryonten und Prokaryonten 
die Isoprenoid-Biosynthese verandern sowie gentechnologische 
Verfahren zur Herstellung dieser transgenen Viren, Eukaryonten 
und Prokaryonten. AuBerdem betrifft sie Verfahren zur Identifi- 
ziereung von Stoffen mit herbizider, antimikrobieller, antipa- 
rasitarer, antiviraler, fungizider, bakterizider Wirkung bei 
Pflanzen und antimikrobieller, antiparasitarer, antimykoti- 
scher, antibakterieller und antiviraler Wirkung bei Mensch und 
Tier. 

Der Biosyntheseweg zur Bildung von Isoprenoiden iiber den klas- 
sischen Acetat/ Mevalonat-Weg und einen alternativen, Mevalo- 
nat-unabhangigen Biosyntheseweg, den Desoxy-D-xylulose- 
Phosphat-Weg, ist bereits bekannt (Rohmer, M., Knani, M., Simo- 
nin, P., Sutter, B., and Sahm, H. (1993): Biochem. J. 295.: 517- 
524). 

Es ist aber nicht bekannt, wie und uber welche Wege in Viren, 
Eukaryonten und Prokaryonten eine Anderung der Isoprenoidkon- 
zentration Uber den Desoxy-D-xylulose-Phoshat-Weg erreicht wer 
den kann. In Fig. 1 ist dieser Biosyntheseweg dargestellt. 

Es werden daher DNA-Sequenzen zur Verfugung gestellt, die fur 
die l-Desoxy-D-xylulose-5-phosphat-Synthase (DOXP-Synthase) , : 
l-Desoxy-D-xylulose-5-phosphatreduktoisomerase(DOXP- 
Reduktoisomerase) oder das gcpE-Protein kodieren. Alle drei Ge 
ne und Enzyme sind an der Isoprenoid-Biosynthese beteiligt. 

Das gcpE-Protein hat eine Kinasefunktion und katalysiert die 
Phosphorylierung eines Zuckers oder eines Phosphorzuckers oder 
einer Vorstufe der Isoprenoidbiosynthese, insbesondere die 
Phosphorylierung von 2-C-Methyl-D-erythritol, 2-C-Methyl-D- 
erythritol-phosphat, insbesondere 2-C-Methyl-D-erythritol-4- 
phosphat, 2-C-Methyl-D-erythrose, 2-C-Methyl-D-erythrose- 
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nhosohat insbesondere 2-C-Methyl-D-erythrose-4-phosphat. 
Tr VorsUfe der Isoprenoidsynthese *atalysiert das gcpE- 
der VorStU ^ eQondere P die PhoS p ho rylierung der folgenden Sub- 

Protein - nchoQnnaere UAC 



Ch!1T-C (CH,, -C (OH, -CH,-O-P0 (OH, „ CH, ,0H, -C (CH,, =C (OH, -CH,-0H. 
C„ OH, -CH iC Hj , -CO-CH.-0-PO (OH, , CH, ,0H, -CH ,«*> -CO-CH,-OH 
CH .C(CH,,-CO-CH,-0-PO(OH>„ CH,-C(CH,,-CO-CH,-OH, 

r CH.OH -CH,-O-P0(0H),, CH,-C(CH,)-CH (OH, -CH,-OH, 

CH <OH» -CH.-O-P0 ,0H, , CH, (OH, -COM -C (OH, -CH,-OH 

CHO-» (CH ,!cH (OH -CH,-0-PO (OH, , CHO-CH (CH,, -CH (OH, -CH,-OH 
r, 0 m C OHUCH, -CH-CH-0-PO (OH, „ CH, (OH, -C (OH, (CH,, -CH-CH-OH 

"Z 'cmOH, -0,,-0-PO (OH, ,. CH ,0.,-C ( CH„ -CH.OH, -CH,-OH. 
(CH,) ,HC-CC-CH,-0-PO (OH, „ (CH,,,HC-CO-CH 2 -0-H, 
,CH,, ,HC-CH ,OH, -CH,-0-PO ,OH„. (CH,, ,HC-CH (OH, -CH,-0-H. 

... . v.f.lvsiert die Kondensatlon von pyruvat und 

d ie DOXP R l,toiso M rase .cataiysiert die 0 m -a„dlun^v,n !- 
Deoxy-D-Kyluiose-5-pbosphat zu 2-C-Methyi-D-erythnto! 

phosphat. (siehe Fig. D • 



... -> ^Hfft die folgenden DNA-Sequenzen: 
Die Erfindung betriftt aie y 

DHA-Seguenzen, die far ein Polypeptid *it der . SEQ IDNO^ 
W- -inos^uresequenz ~d«r. -Oder e n ^ 
Oder Derivat des Polypeptxds gemaB SEQ ID NO.2. 
»enrere Aninosauren deletiert. hinzugerUgt oder durch andere 
Aminosauren substituiert worden sind, 

DNA-Seguenzen. die fl» ein Poiypeptid It der i , . SEQ « NO: 4 
dargestellten Auinosaureseguenz f " "° ^ l deI 

Oder Derivat des Polypeptids ge^a SEQ ID NO: 4, worxn eine 
mehrere Mdnosauren deletiert. hinzugefagt Oder durch andere 
tainosauren substituiert worden sind, 

* 

• o ™a Seauenzen, die f ttr ein Polypeptid mit der in SEQ ID 
sowie DNA-Sequenzen, . _ ^.-i- e i n 

M n ft rt.raestellten Aminosauresequenz codieren oder fur ein 
NO: 6 dargesteixten worm 

n^r-ivat des Polypeptids gemaB SEQ id nu- °» 
Analoges oder Derivat des yp P hin2ug efugt oder durch 

eine oder mehrere Aminosauren deletiert, hinzuget g 
andere Aminosauren substituiert worden sind. 
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* 

Die Gene and ihre Genprodukte (Polypeptide) sind im Sequenzpro- ' 
tokoll mit ihrer PrimSrstruktur aufgefOhrt und haben folgende 

Zuordnung: n ^ 
SEQ ID HOsl: l-Desoxy-D-xylulose-5-phosphatreduktoxsomerase-Gen 

SEQ ID NO: 2: i-Desoxy-D-xylulose-5-phosphatreduktoisomerase 

SEQ ID NO: 3: l-Desoxy-D-xylulose-5-phosphat-Synthase-Gen 

SEQ ID NO: 4: l-Desoxy-D-xylulose-5-phosphat-Synthase 

SEQ ID NO: 5: gcpE-Gen 

SEQ ID NO: 6 : gcpE-Proteine. 

* 

Die DNA-Sequenzen stammen alia aus Plasmodium falciparum. 

AuBer den im Sequenzprotokoll genannten DNA-Sequenzen sind auch 
solche geeignet, die infolge der Degeneration des genet.schen 
Codes eine andere DNA-Sequenz besitzen, jedoch far das glexche 
Polypeptid Oder far ein Analoges oder Derivat des Polypeptxds 
kodferen, worin eine oder mehrere Aminos.uren delet.ert, h.nzu- 
gefagt oder durch andere AminosSuren substituiert worden sind. 

Die erfindungsgemaaen Sequenzen eignen sich far 

von Genen in Viren, Eukaryonten und Prokaryonten, die fUr die 

Isoprenoid-Biosynthese des 1-Desoxy-D-xylulose-Wegs verantwort- 

lich sind. 

Brxindungsge.naB geheren zu den Eukaryonten oder 

Zellen tierischen Zellen, Pflanzenzellen. Mgen. Hefen. Pxlze 

u„"zu den Prokaryonten oder prokaryontischen Bakterien Archae- 

bakterien und Eubakterien. 

Bel integration einer D»A-Sequenz in ein Geno*, au£ der eine 

der oben angegebenen DNA-Sequenzen lokalisiert 1st, «rd dre 

Expression der oben bescnriebenen Gene in Viren 

und Prokaryonten eruOglicht. Die erf indungsgemaB tran 

ten Viren, Eukaryonten und Prokaryonten werden 

kannter Weise gezOchtet und das wahrenddessen gebx Idet e sopre 

noid isoliert und gegebenenzalls gereimgt. fecht alle Isopre 

noide mussen isoliert werden, da die Isopreno.de in exmgen 

Fallen direkt in die Raumluft abgegeben werden. 
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* * 

Die Erfindung betrif ft ferner ein Verfahren zur Herstellung von ' 
transgenen Viren, EuVcaryonten unci- Prokaryonten zur Verande rung 
des Isoprenoid-Gehaltes, das die folgenden Schritte enthalt. 

a) Herstellung einer DNA-Sequenz mit folgenden Teilsequenzen 

i) Promoter, der in Viren, Eukaryonten und Prokaryonten - 
aktiv ist und die Bildung einer RNA xm vorgesehenen 
Zielgewebe oder den Zielzellen sicherstellt, 

ii) DNA-Sequenz, die far ein Polypeptid mit der in SEQ ID 
NO: 2, 4 oder 6 dargestellten Aminosauresequenz codxeren 
oder' far ein Analoges oder Derivat des Polypeptids ge- 
maB SEQ ID NO: 2, 4 oder 6, 

iii) 5'- und 3^-nichttranslatierte Sequenz, die in Viren, 
Eukaryonten und Prokaryonten die Expression der be- 
zeichneten Gene ermSglichen oder verbessern, 

b) Transfer und Einbau der DNA-Sequenz in das Genom von Viren, 
prokaryontischen oder eukaryontischen Zellen mit oder ohne 
Verwendung eines Vektors <z.B. Plasmid, virale DNA) . 

Aus derart transformierten Pf lanzenzellen kOnnen die intakten 
ganzen Pflanzen regeneriert werden. 

Die far die Proteine kodierenden Sequenzen mit den Nukleotidab- 
folgen Seq ID NO:l, Seq ID NO: 3 und Seq ID NO: 5 kSnnen mxt ei- 
nem die Transkription in bestimmten Organen oder Zellen sxcher- 
stellenden Promotor versehen werden, der in sense-Orientxerung 
(3*-Ende des Promotors zum S'-Ende der kodierenden Sequenz) an 
die Sequenz, die das zu bildende Protein kodiert, gekoppelt 
ist An das 3^-Ende der kodierenden Seqeunz wird ein dxe Termi- 
nation der mRNA-Synthese bestimmendes Terminationssignal ange- 
hangt. Om das zu exprimierende Protein in bestimmte subzellula- 
re Kompartimente, wie Chloroplasten, Amyloplasten, Mitochondrx- 
en, Vakuole, Cytosol oder Interzellularraume zu dirigxeren, 
kann zwischen den Promotor und die kodierende Sequenz noch exne 
far eine sogenannte Signalsequenz oder ein Transitpeptxd kodxe- 
rende Sequenz gesetzt werden. In einigen Fallen ist es erfor- 
derlich, Sequenzen einzufagen, die fur eine Signalsequenz am 
COOH-Terminus des Proteins kodieren. Die Sequenz muB xm glex- 
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chen Leserahmen wi. die kodierende Sequenz 4es . 
Z„r Vorbereitung der EinfUhrun, der erfindungsgemaBen °™ ^ 
Seguenz.n in hohere Pflanzen sind ein. groBe Anzahl von 1 
rungsvektoren verfOgbar. die ein Replikationssignal 
und einen Marker beinhalten. der eine Section der 
mierten Sellen erlaubt. ,e nach \ 
Gene in die Pflanze konnen weitere DNA-Seguenzen erforderi oh 
sein Werden zum Beispiel for die Transformation der Pflanzen 
ze e d as V oder Ri-Plasmid verwendet. so muB 
rechte Begrenzung, haufig Jedoch die rechte und die Unke Be 
„ 1, Tl- und Ri-Plasmid T-.DHA als Flankenbereich den 
hren en Oenen eingefOgt verden. Die Verwendung » - 
r ale Transforation von Pflanzen zellen ist 
sucht und ausreichend in BP 120516; Hoekama, in: The 
Piant vector System. Of fset-drukk.rii Kanter B.V. Mb asserdam 
(1985). Chapter V; Fraley et al.. Crit. Rev. Plant S ci. M 46 

undAnetal. ,1985, MO J. 4. ™ s " 

die eingef<lhrte DNA einmal im Genom integnert, so ist sie 
der Reqel stabil und bleibt auch in den Hachkommen der ur 
sprung! * transformierten Sellen erhalten. Sie «^ 
lerveise einen Selektionsmarker, der den transformierten Pflan 
1 n Resistenz gegenUber einem Biozid Oder 

• v anamvc in G 418, Bleomycin, Hygroraycin oder Pnos 
tikum, wie Kanamycin, o j M . r v Pr - 

phinotricin u.a. vermittelt. Der individueil vervendete Marker, 
some daher die Seiektion transferrer Zeiien gegenUber 
Zellen, denen die eingefugte DNA fehlt. gestatten. 

Far die Einfuhrung von DHA in eine Pflanze stehen viele Techni- 

Z t^ZX^. - Motion von .A die 
Elekroooration. so»ie ballistische Methoden und die Virusinfek 

Tus dem transform Pflanzenmaterial kennen dan, > 
geeigneten Medium, welches Antibiotika oder "«*^™ 
tion enthalten kann. wieder ganze Pflanzen "^"^J^ . 
Bei der motion und Elektroporation sind an sic kein spe 
ellen Anf orderungen an die Plasmide gestellt . Sollen aber 
derartig transformierten Zellen ganze Pflanzen regeneriert wer 
derartig tra se lektierbaren Markergens not- 

den, ist die Anwesenheit eines ki«»« 
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wendig. Die transformierten Zellen wachsen i-erhalb de r Pflan- 
zen in der ablichen Weise (McCormick et al. (1986), Plant Cell 
Reports 5, 81-84). Die Pflanzen konnen normal angezogen werden 
and It Pflanzen, die die gleiche trans formierte Erbanlage Oder 
andere Erbanlagen haben, gekreuzt werden. Die daraus entstehen, 
den individuen haben die entsprechenden phanotypischen Eigen- 
schaften. 

Weiterhin sind Gegenstand der Erfindung Expressionsvektoren, 
die eine oder mehrere der erfindungsgemafien DNA-Sequenzen ent- 
halten. Solche Expressionsvektoren. erhalt man, indem man die 
erf indungsgema&en DNA-Sequenzen mit geeigneten funktionellen 
Regulationssignalen versieht. Solche Regulationssignale smd 
DNA-Sequenzen, die far die Expression verantwortlich sind bei- 
spielsweise Promotoren, Operatoren, Enhancer, ribosomale Bin- 
dungsstellen, and die vom Wirtsorganismus erkannt werden, 

Gegebenenfalls kbnnen noch weitere Regulationssignale, die bei- 
spielsweise Replikation oder Rekombination der rekombinanten 
DNA im Wirtsorganismus steuern, Bestandteil des Expressions vek- 



tors sem 



Ebenso geharen die mit den erf indungsgemaBen DNA-Sequenzen oder 
Expressionsvektoren transformierten Wirtsorganismen zum Gegen- 
stand der Erfindung. 

Far die Expression der erf indungsgemaBen Enzyme eignen sich be- 
sonders solche Wirtszellen und Organismen, die keine mtnnsi- 
schen Enzyme mit der Funktion der DOXP-Synthase, der DOXP- 
Reduktoisomerase oder des gcpE-Proteins aufweisen. Dies tnf ft 
fur Archaebacterien, Tiere, Pilze, Schleimpilze und einige Eu- 
bakterien zu. Durch das Fehlen dieser intrinsischen Enzymakti- 
vitaten wird die Detektion und Auf reinigung der rekombinanten 
Enzyme wesentlich erleichtert. Auch wird es erst dadurch m6g- 
lich, mit geringem Aufwand die Aktivitat und insbesondere die 
Hemmung der Aktivitat der erf indungsgemaBen rekombinanten Enzy- 
me durch verschiedenen Chemikalien und Pharmaka in Rohextrakten 
aus den Wirtszellen zu messen. 
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Die Expression der erf indungsgemaBen Enzyme erfolgt vorteilhaf- ' 
terweise dann in eukaryontischen Zelleri, wenn posttranalatori- 
sche Modifikationen und eine native Faltung der Polypeptidkette 
erreicht werden soil. AuBerdemwird in Abhangigkeit vom Expres- 
sionssystem bei der Expression genomischer DNA-Sequenzen er- . 
reicht, da* Introns durch SpleiBen der DNA beseitigt und die 
Enzyme in der fur die Parasiten charakteristischen Polypep- 
tidsequenz produziert werden. Fur Introns codierende Sequenzen 
k6nnen auch durch rekombinante DNA-Technologie aus den zu ex- 
primierenden DNA-Sequenzen beseitigt Oder experimentell exnge- 
fOgt werden. 

Die Isolierung des Proteins kann aus der Wirtszeile Oder dem 
Kulturuberstand der Kirtszelle nach dem Pachmann bekannten Ver- 
fahren erfoigen. Es kann auch eine in vitro Reakti.ierung der 
Enzyme erforderlich sein. 

Zur Erieichterung der Aufreinigung konnen die errindungsgema»en 
Enzyme oder Teilseguenzen der Enzyme als Pusionsprotezn mxt 
verschiedenen peptidketten exprimiert werden. Dazu exgenen sic. 
besonders OUgo-Histidin-Seguenzen und Sequenzen. dxe von der 

. Thioredoxin Oder Calmbdulin-bindenden 

Glutathion-S-Transferase, Thxoreaoxin ou 

Peptiden abgeleitet sind. 

Weiterhin konnen die erfindungsgemaAen Enzyme Oder 

zen der Enzyme als Pusionsprotein mit soichen. dem Pachmann be 

kannten. Peptidketten exprimiert -erden. da* die 

Enzyme in das extrazeUuXare Millieu oder in bestimmte Kompar 

timente der «irtsze!Xen transportiert -erden. Dadurch kanno- 

„ohl die Aufreinigung, als auch die Ontersuchun, der biologx 

schen Aktivitat der Enzyme erleichtert verden . 

Bel der Expression der erf indungsgem«en Enzyme kann es sich 
ais zweckmaMg erweisen, einzelne Codone zu verandern. Dabex 
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ist der gezielte Austausch von Basen in der kodierenden Region 
auch sinnvoll, wenn die genutzten Codone in den Parasiten ab- 
weichend sind von der Codonnutzung in, heterologen Expressions- 
system, urn eine optimale Synthese des Proteins zu gewahrlex- 



sten. 



Weiterhin k5nnen die erf indungsgemaBen Enzyme unter standardx- 
sierten Bedingungen durch dem Fachmann bekannte Techniken durch 
in vitro-Translation gewonnen werden. Dafur geeignete Systeme 
sind Kaninchen-Reticulozyten- und Weizenkeimextrakte and Bakte- 
rienlysate. Auch kann in vitro transskribierte mRNA in Xenopus- 
Oocyten translatiert werden. 

Durch chemische Synthese kbnnen Oligo- und Polypeptide herge- 
stellt werden, deren Sequenzen aus der Peptidsequenz der erfxn- 
dungsgemSBen Enzyme abgeleitet sind. Bei geeigneter Wahl der 
Sequenzen besitzen derartige Peptide Eigenschaf ten, die fUr dxe 
erfindungsgemaBen Enzyme charakteristisch sind. Derartige Pep- 
tide kSnnen in groBen Mengen hergestellt werden und eignen sxch 
besonders far Studien Uber die Kinetik der Enzymaktivxtat , dxe 
Regulation der Enzymaktivitat, die dreidimensionale Struktur 
der Enzyme, die Henunung der Enzymaktivitat durch verschiedenen 
Chemikalien und Pharmaka und die Bindungsgeometrie und Bindugn- 
saffinitat verschiedener Liganden. 

Vorzugsweise wird zur rekombinanten Herstellung der erfindungs- 
gemaBen Enzyme eine DNA mit den Nukleotiden aus den Sequenzen 
SEQ ID NO: 1, 3 und 5 verwendet. 

Die Erfindung umfaBt daher auBerdem ein Verfahren zum Screening 
nach Verbindungen, die desDfcsoxy-D-xylulose-Phosphat- 
Stoffwechselweg inhibieren. GemaB diesem Verfahren wxrd exn 
Wirtsorganismus, der einen rekombinanten Expressxonsvektor ent- 
hllt. wobei der Vektor zumindest einen Teil der 0Ug~.cl.o- 
tidsequenz gemaB SEQ ID NO:l, SEQ ID NO: 3 oder SEQ ID NO. 5 
oder Varianten oder Homologe dieser aufweist, und auBerdem exne 
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Verbindung. von der vermutet wird, da* ale eine . 
le antiparasitsre, antibakterielle, antivrrale und antimykotl 
sehe Wiring bei Mensch and Tier Oder eine antimikrobxelle an- 
t v ra!e. bakterizlde. herbizide Oder fungizide Wlrkung b e 
P £1 anzen hat. bereitgestellt. AnscbUeBend -rd 
nismus mit der verbindung in Kontakt gebracht and die VHrksam 
keit der Verbindung bestimmt. 

Eli weiterer Gegenstand dieser Erfindung sind Metbcden zur Be- 
strung der enzymatische Aktivitat des ^pC-Protexns. D ese 
kann nach bekannten Verfahren besti-t werden. Hxerbez wxrd die 
pTosphorylierung eines Zuckers Oder eines ^™*TL. 
einer Vorstufe der Isoprenoidbiosynthese, insbesondere dxe 
Pnos horylierung von 2-C-«ethyl-D-erythritol. 
erytbritol-phosphat. insbesondere 2-C-«etby -D-erythrrto 4 
phosphat, 2-C-Methyl-D-erythrose. 2-C-«ethyl-D-erythro S e 
phosphat. insbesondere 2-C-Methyl-D-erythros.-4-phosphat de 
tektlert. Ein -eiterer Gegenstand dieser Erfindung rat die Ver 
„endung dieser MefWerfahren zur Ermittlung von Stoffen. d.e 
Aktivitat der jeweiligen Enzyme inhibieren. 

Die enzymatische Aktivitat von DOXP-Synthase 
Reduktisomerase kann in einem einzigen Schxtt "« 
den. indem die Omwandlung von Glycerinaldehyd-3-phosphat zu 
C-Methylerythritol-4-phosphat bestimmt wird. 

Analog erfolgt die Bestimmun, der Aktivitaten von ^Syntnase 
und DOXP-Reduktoisomerase. Far die Bestxmmun, der *** 
Synthase-Aktivitat eignen sich auch ^^"^"^ 

„..„-„l et al besehrieben (Querol et al. Abstracts 4 
wie von Querol et al. oes o ar(:e i 0 na 21-23 April 

european symposium on plant isoprenoids. Barcelona 



1999) . 
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Patentansprtiche 

fur ein Polypeptid mit der in SEQ ID NO: 
» . DNA-Sequenzen, die fur ein roxyt«=f 

2 dargestellten Aminosauresequenz codieren oder fiir ein 
Analoges oder Derivat des Polypeptids gema* SEQ ID NO:2 
worin eine oder mehrere Aminosauren deletiert, hinzugefugt 
oder durch andere Aminosauren substituiert worden sind. 

, io frfir ein Polvpeptid mit der in SEQ ID NO: 
2. DNA-Sequenzen, die fur ein foj-ypef*- 

4 dargestellten Aminosauresequenz codieren oder fur ein 
Analoges oder Derivat des Polypeptids gema* SEQ ID NO:4 
worin eine oder mehrere Aminosauren deletiert, hinzugefugt 
oder durch andere Aminosauren substituiert worden sind. 

j • _ ftir ein Polypeptid mit der in SEQ ID NO: 

3. DNA-Sequenzen, die fur ein roxypeyux 

6 dargestellten Aminosauresequenz codieren oder fur ein 
Analoges oder Derivat des Polypeptids gemaB SEQ ID NO: 6 
worin eine oder mehrere Aminosauren deletiert, hinzugefOgt 
oder durch andere Aminosauren substituiert worden sind. 

4. DNA-Sequenz gemaB einem der Anspruche 1 bis 3, dadurch ge- 
kennzeichnet, da* sie auBerdem funktionelle Regulations- 
signale, insbesondere Promotoren, Operatoren, Enhancer, ri- 
bosomale Bindungsstellen, aufweist. 



5. 



DNA-Sequenz mit folgenden Teilsequenzen 



i) 



6. 



-aeuueii* »u*w = - 

Promoter, der in Viren, Eukaryonten und Prokaryonten 
aktiv ist und die Bildung einer RNA im vorgesehenen 
Zielgewebe oder den Zielzellen sicherstellt, 

ii) DNA-Sequenzen gemaB einem der Anspriiche 1 bis 3, 

iii) 3-nichttranslatierte Sequenz, die in Viren, Eukaryon- 
ten und Prokaryonten zur Addition von Poly-A Resten an 
das 3^-Ende der RNA filhrt. 

Verfahren zur Hersteilung von transgenen Viren 
und Prokaryonten zur Veranderung des 1 "P"" 01 ^^"^ 
dadurch gelcennzeichnet. da* eine DNA-Sequenz gemau Anspruch 
f Oder 5 in das Genoa .on Viren. euKaryontischen und proKa- 
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ryontischen Zellen mit oder ohne Verwendiirig eines Vektors 
transferiert und eingebaut wird. 

* m * 

1. Transgene Systeme, insbesondere Pflanzen und Pflanzehzel- 
len welche ein oder mehrere DNA-Sequenzen gemaB der An- . 
sprUche 1 bis 5 als „fremde" oder „zusatzliche" DNA enthal- 
ten, die exprimiert werden. 

8. Expressionsvektor, enthaltend eine oder mehrere DNA- 
Sequenzen gemaB Anspruch 1 bis 5. 

t 

9. Protein, welches am l-Deoxy-D-Xylulose-5-Phosphat- 
Stoffwechselweges beteiligt ist und a) codiert wird von den 
DNA-Sequenzen SEQ ID NO: 1,3 oder 5 oder b) codiert wird 
von DNA-Sequenzen, die mit den DNA-Sequenzen SEQ ID NO: 
1,3,5 oder Fragmenten dieser DNA-Sequenzen im DNA-Bereich, 
der far das reife Protein codiert, hybridisieren. 

10. Protein nach den Anspruch 9, erhaltlich aus den Kulturiiber- 
standen von Parasiten oder aus den aufgeschlossenen Parasi- 
ten und Aufreinigung viber chromatographische und elektro- 
phoretische Techniken. 

11. Protein nach einera der Anspruche 9 und 10, dadurch gekenn- 
zeichnet, daB es a) das Produkt einer viralen, prokaryonti- 
schen oder eukaryontischen Expression einer exogenen DNA 
ist, b) codiert wird von den Sequenzen SEQ ID NO: 1, 3 oder 
5 oder codiert wird von DNA-Sequenzen, die mit den in den 
DNA-Sequenzen SEQ ID NO: 1, 3 oder 5 oder Fragmenten dieser 
DNA-Sequenzen im DNA-Bereich, der ftir das reife Protein ko- 
diert, hybridisieren, oder c) codiert wird von DNA- 
Sequenzen, die ohne Degeneration des genetischen Codes mit 
den in b) definierten Sequenzen hybridisieren wiirden und 

* 

far ein Polypeptid mit entsprechender AminosSure-Sequenz 
kodieren. 
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12.. Protein gemaB einem der vorangehenden Anspruchen, dadurch 
gekennzeichnet, daB es die Aminosauresequenzen SEQ ID NO: 
2, 4 oder 6 aufweist. 

13. Verfahren zur Bestimmung der enzymatischen Aktivitat des 

gcpE-Proteins, dadurch gekennzeichnet, daB Phosphorylierung 
eines Zuckers oder eines Phosphorzuckers oder einer Vorstu- 
fe der isoprenoidbiosynthese, insbesondere die Phosphory- 
lierung von 2-C-Methyl-D-erythritol, 2-C-Methyl-D- 
erythritol-phosphat, insbesondere 2-C-Methyl-D-erythritol- 
4-phosphat, 2-C-Methyl-D-erythrose, 2-C-Methyl-D-erythrose- 
phosphat, insbesondere 2-C-Methyl-D-erythrose-4-phosphat, 
und der Phosphat- und Alkoholvorstufen, detektiert wird. 

14. Verfahren nach Anspruch 13, dadurch gekennzeichnet, dafi die 
Phosphorylierung der folgenden Phosphate oder Alkohole de- 
tektiert wird: 

CH 2 (OH) -C (CH 3 ) =C (OH) -CH 2 -0-PO (OH) 2 , 
CH 2 (OH) -C (CH 3 ) =C (OH) -CH 2 -OH, 

CH 2 (OH) -CH (CH 3 ) -CO-CH 2 -0-PO (OH) 2 , CH 2 (OH) -CH (CH 3 ) -CO-CH 2 -OH 
CH 2 =C (CH 3 ) -CO-CHz-O-PO (OH) 2, CH 2 =C (CH 3 ) -CO-CH 2 -OH, 
CH 2 =C (CH 3 ) -CH (OH) -CH 2 -0-PO (OH) 2 , CH 2 =C (CH 3 ) -CH (OH) -CH 2 -OH, 
CH 2 (OH) -C (=CH 2 ) -C (OH) -CH 2 -0-P0 (OH) 2 , 

CH 2 ( OH ) -C ( =CH 2 ) -C ( OH ) -CH 2 -OH 
• CHO-CH(CH 3 )-CH(OH)-CH 2 -0-PO(OH) 2 , CHO-CH (CH 3 ) -CH (OH) -CH 2 -OH, 

CH 2 (OH) -C (OH) (CH 3 ) -CH=CH-0-PO (OH) 2 , 

CH 2 (OH) -C (OH) (CH 3 ) -CH=CH-OH 

CH (OH) =C (CH 3 ) -CH (OH) -CH 2 -0-PO (OH) 2 , 

CH (OH) =C (CH 3 ) -CH (OH) -CH 2 -OH, 
(CH 3 ) 2 HC-CO-CH 2 -0-PO (OH) 2 , 
(CH 3 ) 2 HC-CO-CH 2 -0-H, 
(CH 3 ) 2 HC-CH (OH) -CH 2 -0-PO (OH) 2 , 

(CH 3 ) 2 HC-CH (OH) -CH2-O-H. 

15. Verfahren zur gekoppelten Bestimmung der enzymatischen Ak- 
tivitat der DOXP-Synthase und der DOXP-Reduktase, dadurch 
gekennzeichnet, dafi die Umwandlung von Glycerinaldehyd-3- 
phosphat zu 2-C-Methylerythritol-4-phosphat detektiert 

wird. 
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16. Verfahren zum Screening einer Verbindung fur die Therapie 
von infektiosen Prozessen bei Mensch und Tier, wobei das 
Verfahren umfaBt: 

a) Bereitstellen einer Wirtszelle, die einen rekombinanten 
Expressionsvektor enthalt, wobei der Vektor. zuniindest 
einen Teil der Olignukleotidsequenz gemaB SEQ ID N0:1, - 

r 

SEQ ID NO: 3 oder SEQ ID NO: 5 oder Varianten oder Ana- 
loga dieser aufweist, und auflerdem eine Verbindung, von 
der vermutet wird, daB sie eine antimykotische, antibio- 
tische, antiparasitare oder antivirale Wirkung bei 

Mensch und Tier hat, 

b) In-Kontakt-Bringen der Wirtszelle mit der Verbindung und 

c) Bestimmung der antiraikrobiellen, antiraykotischen, anti- 
biotischen, antiparasitaren oder antiviralen Wirksamkeit 
der Verbindung. 

17. Verfahren zum Screening nach Verbindungen zur Behandlung 
von Pflanzen, wobei das Verfahren umfaBt: 

a) Bereitstellen einer Wirtszelle, ,die einen rekombinanten 
Expressionsvektor enthalt, wobei der Vektor zumindest 
einen Teil der Olignukleotidsequenz gemaB SEQ ID NO:l, 
SEQ ID NO: 3 oder SEQ ID NO: 5 oder Varianten oder Ana- 
loga dieser aufweist, und auBerdem eine Verbindung, von 
der vermutet wird, daB sie eine antimikrobielle, antivi- 
rale, antiparasitare, bakterizide, fungizide oder herbi- 
zide Wirkung bei Pflanzen hat, 

b) In-Kontakt-Bringen der Wirtszelle mit der Verbindung und 

c) Bestimmung der antimikrobiellen, antiviralen, antipara- 
sitaren, bakteriziden, fungiziden oder herbiziden Wirk- 
samkeit der Verbindung. 

* 

18. Verwendung von DNA nach einem der AnsprUche 1 bis 5 oder 
von Proteinen nach einem der AnsprUche 9 bis 12 oder von 
transgenen Systemen nach Anspruch 7 zur Vorbeugung oder 
Therapie von Erkrankungen bei Mensch und Tier. 
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SEQOENZPROTOKOLL 



<110> Jomaa, Hassan 



<120> Gene des l-Desoxy-D-xylulose-Biosynthesewegs 



<130> 15696 



<140> PCT/EP99 
<141> 1999-09-22 



<150> DE19923567.8 
<151> 1999-05-22 

<150> DE19843279.8 
<151> 1998-09-22 



<160> 6 



<170> Patent In Ver. 2.1 



<210> 1 
<211> 1467 
<212> DNA 

<213> Plasmodium falciparum 



<220> 

<221> CDS 

<222> (1) . . (1467) 

<220> 

<221> gene 

<222> (1) . . (1467) 



<220> 

<221> mRNA 

<222> (1) . . (1467) 



<400> 1 

atg aag aaa tat att tat ata tat ttt ttc ttc ate aca ata act att 48 

Met Lys Lys Tyr lie Tyr He Tyr Phe Phe Phe lie Thr He Thr lie 
! 5 10 15 
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aac gat tta gta ata aat aat aca tea aaa tgt gtt tec att gaa aga 
Asn Asp Leu Val lie Asn Asn Thr Ser Lys Cys Val Ser lie Glu Arg 

20 25 30 

t 

* 

aga aaa aat aac gca tat ata aat tat ggt ata gga tat aat gga cca 
Arg Lys Asn Asn Ala Tyr lie Asn Tyr Gly He Gly Tyr Asn Gly Pro 
35 40 45 

V 

gat aat aaa ata aca aag agt aga aga tgt aaa aga ata aag tta tgc 

Asp Asn Lys He Thr Lys Ser Arg Arg Cys Lys Arg He Lys Leu Cys 
50 55 . 60 

aaa aag gat tta ata gat att ggt gca ata aag aaa cca att aat gta 
Lys Lys Asp Leu lie Asp lie Gly Ala He Lys Lys Pro He Asn Val 
65 70 75 80 

gca att ttt gga agt act ggt agt ata ggt acg aat get tta aat ata 
Ala He Phe Gly Ser Thr Gly Ser He Gly Thr Asn Ala Leu Asn He 

85 90 95 

ata agg gag tgt aat aaa att gaa aat gtt ttt aat gtt aaa gca ttg 
He Arg Glu Cys Asn Lys He Glu Asn Val Phe Asn Val Lys Ala Leu 

100 105 HO 

tat gtg aat aag agt gtg aat gaa tta tat gaa caa get aga gaa ttt 
Tyr Val Asn Lys Ser Val Asn Glu Leu Tyr Glu Gin Ala Arg Glu Phe 
115 120 125 

tta cca gaa tat ttg tgt ata cat gat aaa agt gta tat gaa gaa tta 
Leu Pro Glu Tyr Leu Cys He His Asp Lys Ser Val Tyr Glu Glu Leu 
130 135 140 

aaa gaa ctg gta aaa aat ata aaa gat -tat aaa cct ata ata ttg tgt 
Lys Glu Leu Val Lys Asn He Lys Asp Tyr Lys Pro He He Leu Cys 
145 150 155 160 

ggt gat gaa ggg atg aaa gaa ata tgt agt agt aat agt ata gat aaa 
Gly Asp Glu Gly Met Lys Glu He Cys Ser Ser Asn Ser He Asp Lys 

165 170 175 

ata gtt att ggt att gat tct ttt caa gga tta tat tct act atg tat 



96 



144 



192 



240 



288 



336 



384 



432 



480 



528 



576 
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* 

lie Val He Gly He Asp Ser Phe Gin Gly Leu Tyr Ser Thr Met Tyr 

180 185 190 



gca att atg aat aat aaa ata gtt gcg tta get aat aaa gaa tec att 
Ala He Met Asn Asn Lys He Val Ala Leu Ala Asn Lys Glu Ser He 
195 200 205 

gtc tct get ggt ttc ttt tta aag aaa tta tta aat att cat aaa aat 
Val Ser Ala Gly Phe Phe Leu Lys Lys Leu Leu Asn He His Lys Asn 
210 215 220 

gca aag ata ata cct gtt gat tea gaa cat agt .gct ata ttt caa tgt 
Ala Lys He He Pro Val Asp Ser Glu His Ser Ala He Phe Gin Cys 
225 230 235 240 

tta gat aat aat aag gta tta aaa aca aaa tgt tta caa gac aat ttt 
Leu Asp Asn Asn Lys Val Leu Lys Thr Lys Cys Leu Gin Asp Asn Phe 

245 250 255 

tct aaa att aac aat ata aat aaa ata ttt tta tgt tea tct gga ggt 
Ser Lys He Asn Asn He Asn Lys He Phe Leu Cys Ser . Ser Gly (fly 

260 265 270 

cca ttt caa aat tta act atg gac gaa tta aaa aat gta aca tea gaa 
Pro Phe Gin Asn Leu Thr Met Asp Glu Leu Lys Asn Val Thr Ser Glu 
275 280 285 

aat get tta aag cat cct aaa tgg aaa atg ggt aag aaa ata act ata 
Asn Ala Leu Lys His Pro Lys Trp Lys Met Gly Lys Lys He Thr He 
290 295 300 

gat tct gca act atg atg aat aaa ggt tta gag gtt ata gaa ace cat 
Asd Ser Ala Thr Met Met Asn Lys Giy Leu Glu Val He Glu Thr His 
305 310 315 320 

ttt tta ttt gat gta gat tat aat gat ata gaa gtt ata gta cat aaa 
Phe Leu Phe Asp Val Asp Tyr Asn Asp He Glu Val He Val His Lys 

325 330 335 

gaa tgc att ata cat tct tgt gtt gaa ttt ata gac aaa tea gta ata 
Glu Cys lie. He His Ser Cys Val Glu Phe He Asp Lys Ser Val He 

340 345 350 



624 



672 



720 



768 



816 



864 



912 



960 



1008 



1056 
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agt caa atg tat tat cca gat atg caa ata ccc ata tta tat tct tta 1104 

■ 

Ser Gin Met Tyr Tyr Pro Asp Met Gin lie Pro lie Leu .Tyr Ser Leu 
355 360 365 

aca tgg cct gat aga ata aaa aca aat tta aaa cct tta gat ttg get 1152 

Thr Trp Pro Asp Arg lie Lys Thr Asn Leu Lys Pro Leu Asp Leu Ala 
370 375 380 

* 

cag gtt tea act ctt aca ttt cat aaa cct tct tta gaa cat ttc ccg 1200 

Gin Val Ser Thr Leu Thr Phe His Lys Pro Ser Leu Glu His Phe Pro 
235 390 . 395 . 400 

tgt art aaa tta get tat caa gca ggt ata aaa gga aac ttt tat cca 1248 

Cys lie Lys Leu Ala Tyr Gin Ala Gly lie Lys Gly Asn Phe Tyr Pro 

405 410 415 

acz gta eta aat gcg tea aat \gaa ata get aac aac tta ttt ttg aat 1296 

Thr Val Leu Asn Ala Ser Asn Glu lie Ala Asn Asn Leu Phe Leu Asn 

420 425 430 

aat aaa att aaa tat ttt gat att tec tct ata ata teg caa gtt ctt 1344 

Asn Lys lie Lys Tyr Phe Asp lie Ser Ser lie lie Ser Gin Val Leu 
435 440 445 

gaa zct ttc aat tct caa aag gtt teg gaa aat agt gaa gat tta atg 1392 

Glu Ser Phe Asn Ser Gin Lys Val Ser Glu Asn Ser Glu Asp Leu Met 
450 455 460 

aag caa att eta caa ata cat tct tgg gee aaa gat aaa get acc gat 1440 

Lys Gin He Leu Gin He His Ser Trp Ala Lys Asp Lys Ala Thr Asp 
465 470 475 480 

ata tac aac aaa cat aat tct tea tag 1467 
He Tyr Asn Lys His Asn Ser Ser 

485 



<210> 2 
<211> 468 
<212> PRT 
. <213> Plasmodium falciparum 
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<400> 2 

Met Lys Lys Tyr He Tyr lie Tyr Phe Phe Phe He Thr lie Thr He 
1 5 10 15 

?.sn Asd Leu Val He Asn Asn Thr Ser Lys Cys Val Ser He Glu Arg 

20 25 30 

Arg Lys Asn Asn Ala Tyr He Asn Tyr Gly He Gly Tyr Asn Gly Pro 

35 40 45 

Asp Asn Lys He Thr Lys Ser Acg Arg Cys Lys Arg He Lys Leu Cys 
50 55 60 

Lvs Lys Asp Leu He Asp He Gly Ala He Lys Lys Pro He Asn Val 
65 70 75 80 

Ala He Phe Gly Ser Thr Gly Ser He Gly Thr Asn Ala Leu Asn He 

85 90 95 

lie Arg Glu Cys Asn Lys He Glu Asn Val Phe Asn Val Lys Ala Leu 

100 105 HO 

Tyr Val Asn Lys Ser Val Asn Glu Leu Tyr Glu Gin Ala Arg Glu Phe 
115 120 I 25 

Leu Pro Glu Tyr Leu Cys He His Asp Lys Ser Val Tyr Glu Glu Leu 
130 135 140 

Lys Glu Leu Val Lys Asn He Lys Asp Tyr Lys Pro He He Leu Cys 
145 150 155 160 

Giy Asp Glu Gly Met Lys Glu He Cys Ser Ser Asn Ser He Asp Lys 

165 170 175 

He Val He Gly He Asp Ser Phe Gin Gly Leu Tyr Ser Thr Met Tyr 

180 185 190 

* 

Ala He Met Asn Asn Lys He Val Ala Leu Ala Asn Lys Glu Ser He 
195 200 205 

Val Ser Ala Gly Phe Phe Leu Lys Lys Leu Leu Asn lie His Lys Asn 
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210 215 220 



la Lys lie lie Pro Val Asp Ser Glu His Ser Ala lie Phe Gin Cys 
225 230 235 240 

* 

Leu Asp Asn Asn Lys Val Leu Lys Thr Lys Cys Leu Gin Asp Asn Phe 

245 250 255 

Ser Lys lie Asn Asn He Asn Lys He Phe Leu Cys Ser Ser Gly Gly 

260 265 270 

Pro Phe Gin Asn Leu Thr Met Asp Glu Leu Lys Asn Val Thr Ser Glu 
275 280 . .285 

Asn Ala Leu Lys His Pro Lys Trp Lys Met Gly Lys Lys He Thr He 
290 295 300 

Asp Ser Ala Thr Met Met Asn Lys Gly Leu Glu Val He Glu Thr His 
305 310 315 320 

Phe Leu Phe Asp Val Asp Tyr Asn Asp lie Glu Val He Val His Lys 

325 330 335 

Glu Cys He He His Ser Cys Val Glu Phe He Asp Lys Ser Val He 

340 345 350 

Ser Gin Met Tyr Tyr Pro Asp Met Gin He Pro He Leu Tyr Ser Leu 
355 360 365 

Thr Trp Pro Asp Arg He Lys Thr Asn Leu Lys Pro Leu Asp Leu Ala 
370 375 380 

Gin Val Ser Thr Leu Thr Phe His Lys Pro Ser Leu Glu His Phe Pro 
385 390 395 400 

Cys He Lys Leu Ala Tyr Gin Ala Gly He Lys Gly Asn Phe Tyr Pro 

405 410 415 

Thr Val Leu Asn Ala Ser Asn Glu He Ala Asn Asn Leu Phe Leu Asn 

420 425 430 

Asn Lys He Lys Tyr Phe Asp He Ser Ser He He Ser Gin Val Leu 
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435 



440 



445 



Glu Ser Phe Asn Ser Gin Lys Val Ser Glu Asn Ser Glu Asp Leu Met 
450 455 460 

Lys Gin He Leu Gin He His Ser Trp Ala Lys Asp Lys Ala Thr Asp 
465 470 475 480 

He Tyr Asn Lys His Asn Ser Ser 

485 



<210> 3 
<211> 3872 
<212> DNA 

<213> Plasmodium falciparum 



<220> 
<221> CDS 

<222> (126) (3740) 
<220> 

<221> gene 

<222> (1)..(3870) 

<220> 

<221> mRNA 

<222> (1) . . (3870) 



<400> 3 

ggtaatatac gcataatata tatataatat attcttacgt atgtatcatt tatgaatcat 60 
aataatattc taaatttacc ttccgttttt gctcgatctt ctcattttcg tttcagcttt 120 

tatca atg att ttt aat tat gtg ttt ttt aag aac ttt gta cca gtt gtt 170 
Met He Phe Asn Tyr Val Phe Phe Lys Asn Phe Val Pro Val Val 
1 5 10 15 

eta tac att etc ctt ata ata tat att aac tta aat ggc atg aat aat 218 
Leu Tyr He Leu Leu He He Tyr He Asn Leu Asn Gly Met Asn Asn 

20 25 30 
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aaa aat caa ata aaa aca gaa aaa att tat ata aag aaa ttg aat agg 266 
Lys Asn Gin He Lys Thr Glu Lys He Tyr He Lys Lys Leu Asn Arg 

35 40 ' 45 



att agt act aat aaa ata tct ggg tec att tea aat att tgt agt aga 
He Ser Thr Asn Lys He Ser Gly Ser He Ser Asn He Cys Ser Arg 

115 120 125 

aat caa aaa gaa aat gaa caa aaa aga aat aaa caa aga tgt tta act 
Asn Gin Lys Glu Asn Glu Gin Lys Arg Asn Lys Gin Arg Cys Leu Thr 
130 135 140 

caa tgt cac act tat aat atg tea cat gaa cag gac aaa eta get aat 
Gin Cys His Thr Tyr Asn Met Ser His Glu Gin Asp Lys Leu Ala Asn 
145 150 155 

gat aat aat agg aat aat aaa aag aat ttt aat tta tta ttt ata aat 
Asp Asn Asn Arg Asn Asn Lys Lys Asn Phe Asn Leu Leu Phe He Asn 
160 165 170 175 



tat ttt aat ttg aaa cga atg aaa aat tct ctt eta aat aaa gac aat 
Tyr Phe Asn Leu Lys Arg Met Lys Asn Ser Leu Leu Asn Lys Asp Asn 

180 185 190 



314 



362 



ttg tea agg aaa aat teg tta tgt agt tct aaa aat aaa ata gca tgc 

Leu Ser Arg Lys Asn Ser Leu Cys Ser Ser Lys Asn Lys He Ala Cys 

50 55 60 

ttg ttc gat ata gga aat gat gat aat aga aat acg aca tat ggc tat 

Leu Phe Asp He Gly Asn Asp Asp Asn Arg Asn Thr Thr Tyr Gly Tyr 

65 70 . 75 



aat gtg aat gtt aaa aat gat gat att aat tec tta eta aaa aat aat 410 
Asn Val Asn Val Lys Asn Asp Asp He Asn Ser Leu Leu Lys Asn Asn 
80 85 90 95 

tat agt aat aaa ttg tac atg gat aag agg aaa aat att aat aat gta 458 
Tyr Ser Asn Lys Leu Tyr Met Asp Lys Arg Lys Asn He Asn Asn Val 

100 105 110 



506 



554 



602 



650 



698 



ttc ttt tac tgt aaa gaa aaa aaa ttg tea ttt ctg cat aag gee tat 



N tat 746 
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Phe Phe Tyr Cys Lys Glu Lys Lys Leu Ser Phe Leu His Lys Ala Tyr 

X95 200 205 



aaa aaa aaa aat tgc act ttt caa aat tat agt tta aaa aga aaa tct 
Lys Lys Lys Asn Cys Thr Phe Gin Asn Tyr Ser Leu Lys Arg Lys Ser 
210 215 220 

aat cgt gat tea cat aaa ttg ttt tct gga gaa ttt gac gat tat aca 
Asn Arg Asp Ser His Lys Leu Phe Ser Gly Glu Phe Asp Asp Tyr Thr 
225 230 235 

aat aat aat get tta tat gaa tec gaa aaa aaa- gaa tac att aca eta 
Asn Asn Asn Ala Leu Tyr Glu Ser Glu Lys Lys Glu Tyr He Thr Leu 
240 245 250 255 

* 

aat aat aat aat aaa aat aat aat aat aaa aat aat gat aat aaa aat 
Asn Asn Asn Asn Lys Asn Asn Asn Asn Lys Asn Asn Asp Asn Lys Asn 

260 265 270 

aat gat aat aat gat tat aat aat aat aat agt tgt aat aat tta gga 
Asn Asp Asn Asn Asp Tyr Asn Asn Asn Asn Ser Cys Asn Asn Leu Gly 

275 280 285 

gag aga tec aat cat tat gat aat tat ggt gga gat aat aat aat cca 
Glu Arg Ser Asn His Tyr Asp Asn Tyr Gly Gly Asp Asn Asn Asn Pro 
290 295 300 

tgt aat aat aat aat gac aaa tat gat ata gga aaa tat ttc aaa cag 
Cys Asn Asn Asn Asn Asp Lys Tyr Asp He Gly Lys Tyr Phe Lys Gin 
305 310 315 

att aat acc ttt att aat att gat gaa tat aaa act ata tat ggt gat 
lie Asn Thr Phe lie Asn He Asp Glu Tyr Lys Thr He Tyr Gly Asp 
320 325 330 335 

gaa ata tat aaa gaa ata tat gaa eta tat gta gaa aga aat att cct 
Glu lie Tyr Lys Glu He Tyr Glu Leu Tyr Val Glu Arg Asn He Pro 

340 345 350 

» 

gaa tat tat gaa cga aaa tat ttt tea gaa gat att aaa aag agt gtc 
Glu Tyr Tyr Glu Arg Lys Tyr Phe Ser Glu Asp He Lys Lys Ser Val 

355 360 365 



794 



842 



890 



938 



986 



1034 



1082 



1130 



1178 



1226 
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tta aaa aaa caa tat tta cct tta tta gca cat gaa tta aaa ata ttt 
Leu Lys Lys Gin Tyr Leu Pro Leu Leu Ala His Glu Leu Lys lie Phe 

435 440 445 

tta ttt ttt att gta aat ata aca gga ggt cat ttt tec tct gtt tta 
Leu Phe Phe lie Val Asn He Thr Gly Gly His Phe Ser Ser Val Leu 
450 455 460 

age tct tta gaa att caa tta tta tta ttg tat att ttt aat caa cca 
Ser Ser Leu Glu He Gin Leu Leu Leu Leu Tyr lie Phe Asn Gin Pro 
465 470 475 

tat gat aat gtt ata tat gat ata gga cat caa gca tat gta cat aag 
Tyr Asp Asn Val He Tyr Asp He Gly His Gin Ala Tyr Val His Lys 
480 485 490 495 

ata ttg acc gga aga aaa eta tta ttt eta tea tta aga aat aaa aaa 
He Leu Thr Gly Arg Lys Leu Leu Phe Leu Ser Leu Arg Asn Lys Lys 

500 505 510 

ggt att agt gga ttc eta aat att ttt gaa agt att tat gat aaa ttt 
Gly He Ser Gly Phe Leu Asn He Phe Glu Ser He Tyr Asp Lys Phe 

515 520 525 

ggg get ggt cac agt tec act tea tta agt get ata caa gga tat tat 



1274 



1322 



10 

* 

eta ttt gat ata gat aaa tat aat gat gtc gaa ttt. gaa aaa get ata 
Leu Phe Asp lie Asp Lys Tyr Asn Asp Val Glu Phe Glu Lys Ala He 
370 375 380 

aaa gaa gaa ttt ata aat aat gga gtt tat att aat aat ata gat aat 
Lys Glu Glu Phe He Asn Asn Gly Val Tyr He Asn Asn He Asp Asn 
385 390 395 

aca tat tat aaa aaa gaa aat att tta ata atg aaa aag ata tta cat 
Thr Tyr Tyr Lys Lys Glu Asn He Leu He Met Lys Lys He Leu His 
400 405 410. 415 

tat ttc cca tta tta aaa tta att aat aat cca tea gat tta aaa aag 1418 
Tyr Phe Pro Leu Leu Lys Leu He Asn Asn Pro Ser Asp Leu Lys Lys 

420 425 430 



1370 



1466 



1514 



1562 



1610 



1658 



1706 



1754 
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Gly Ala Gly His Ser Ser Thr Ser Leu Ser Ala lie Gin Gly Tyr Tyr 
530 535 540 

* * + 

gaa gcc gag tgg caa gtg aag aat aaa gaa aaa tat gga aat gga gat 1802 
Glu Ala Glu Trp Gin Val Lys Asn Lys Glu Lys Tyr Gly Asn Gly Asp 
545 550 555 

ata gaa ata agt gat aac gca aat gtc acg aat aat gaa agg ata ttt 
He Glu He Ser Asp Asn Ala Asn Val Thr Asn Asn Glu Arg He Phe 
560 565 570 575 

caa aaa gga ata cac aat gat aat aat att aac aat aat att aat aat 
Gin Lys Gly He His Asn Asp Asn Asn He Asn Ash Asn He Asn Asn 

580 585 590 

aat aat tat ate aat cct tea gat gtg gta gga aga gaa aat acg aat 1946 
Asn Asn Tyr lie Asn Pro Ser Asp Val Val Gly Arg Glu Asn Thr Asn 

595 600 605 



1898 



gta cca aat gta cga aat gat aac cat aac gtg gat aaa gta cac att 
Val Pro Asn Val Arg Asn Asp Asn His Asn Val Asp Lys Val His He 
610 615 620 

get att ata gga gat ggt ggt tta aca ggt gga atg gca tta gaa gcg 
Ala He He Gly Asp Gly Gly Leu Thr Gly Gly Met Ala Leu Glu Ala 
625 630 635 

tta aat tat att tea ttc ttg aat tct aaa att tta att att tat aat 
Leu Asn Tyr He Ser Phe Leu Asn Ser Lys He Leu lie lie Tyr Asn 
640 645 650 655 

gat aac gga caa gtt tct tta cca aca aat gcc gta agt ata tea ggt 
Asp Asn Gly Gin Val Ser Leu Pro Thr Asn Ala Val Ser lie Ser Gly 

660 665 670 

aat aga cct ata ggt tct ata tea gat cat tta cat tat ttt gtt tct 
Asn Arg Pro lie Gly Ser lie Ser Asp His Leu His Tyr Phe Val Ser 

675 680 685 

* 

aat ata gaa gca aat get ggt gat aat aaa tta teg aaa aat gca aaa 
Asn He Glu Ala Asn Ala Gly Asp Asn Lys Leu Ser Lys Asn Ala Lys 
690 695 700 



1994 



2042 



2090 



2138 



2186 



2234 
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gag aat aac att ttt gaa aat ttg aat tat gat tat att ggt gtt gtg 2282 

Glu Asn Asn lie Phe Glu Asn Leu Asn Tyr Asp Tyr lie Gly Val Val 
705 710 715 | 

aat ggt aat aat aca gaa gag etc ttt aaa gta tta aat aat ata aaa 2330 
Asn Gly Asn Asn Thr Glu Glu Leu Phe Lys Val Leu Asn Asn lie Lys 
720 725 730 735 



gaa aat aaa tta aaa aga get act gtt ctt cat gta cgt aca aaa aaa 
Glu Asn Lys Leu Lys Arg Ala Thr Val Leu His Val Arg Thr Lys Lys 

740 745 750 

* a 

teg aat gat ttt ata aat tea aag agt cca ata agt ata ttg cac tct 
Ser Asn Asp Phe He Asn Ser Lys Ser Pro He Ser He Leu His Ser 

755 760 765 

ata aag aaa aat gag att ttc cct ttc gat ace act ata tta aat gga 
He Lys Lys Asn Glu He Phe Pro Phe Asp Thr Thr He Leu Asn Gly 
770 775 780 

aat att cat aag gag aac aag ata gaa gaa gag aaa aat gtg tct tea 
Asn He His Lys Glu Asn Lys He Glu Glu Glu Lys Asn Val Ser Ser 
785 790 795 

tct aca aag tat gat gta aat aat aag aat aat aaa aat aat gat aat. 
Ser Thr Lys Tyr Asp Val Asn Asn Lys Asn Asn Lys Asn Asn Asp Asn 
800 805 810 815 

agt gaa att ata aaa tat gaa gat atg ttt tea aaa gag acg ttc aca 
Ser Glu He He Lys Tyr Glu Asp Met Phe Ser Lys Glu Thr Phe Thr 

820 825 830 

gat ata tat aca aat gaa atg tta aaa tat tta aag aaa gat aga aat 
Asp He Tyr Thr Asn Glu Met Leu Lys Tyr Leu Lys Lys Asp Arg Asn 

835 840 845 

ata ata ttc eta tct ccc get atg tta gga gga tea gga ttg gtt aaa 
He He Phe Leu Ser Pro Ala Met Leu Gly Gly Ser Gly Leu Val Lys 
850 855 860- 

att agt gag cgt tat cca aat aat gta tat gat gta ggt ata gca gaa 



2378 



2426 



2474 



2522 



2570 



2618 



2666 



2714 



2762 
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He Ser Glu Arg Tyr Pro Asn Asn Val Tyr Asp Val Gly He Ala Glu 
865 870 875. 



caa cat tct gta act ttc gca gca get atg gca atg aat aag aaa tta 

* 

Gin His Ser Val Thr Phe Ala Ala Ala Met Ala Met Asn Lys Lys Leu 
880 885 890 895 

aaa ata caa tta tgt ata tat teg acc ttt tta caa aga gca tat gat 
Lys He Gin Leu Cys He Tyr Ser Thr Phe Leu Gin Arg Ala Tyr Asp 

900 905 910 

caa att ata cat gat ctt aat tta caa aat ata. cct tta aag gtt ata 
Gin He He His Asp Leu Asn Leu Gin Asn lie Pro Leu Lys Val He 

915 920 925 

att gga aga agt gga tta gta gga gag gat ggg gca aca cat caa ggt 
He Gly Arg Ser Gly Leu Val Gly Glu Asp Gly Ala Thr His Gin Gly 
930 935 940 

ata tat gat tta tct tat ctt ggg aca ctt aac aat gca tat ata ata 
He Tyr Asp Leu Ser Tyr Leu Gly Thr Leu Asn Asn Ala Tyr He He 
945 950 955 

tct cca agt aat caa gtt gat ttg aaa aga get ctt agg ttt get tat 
Ser Pro Ser Asn Gin Val Asp Leu Lys Arg Ala Leu Arg Phe Ala Tyr 
960 965 970 975 

tta gat aag gac cat tct gtg tat ata cgt ata ccc aga atg aac ata 
Leu Asp Lys Asp His Ser Val Tyr He Arg He Pro Arg Met Asn He 

980 985 990 

, tta agt gat aag tac atg aaa gga tat ttg aac att cat atg aaa aat 
Leu Ser Asp Lys Tyr Met Lys Gly Tyr Leu Asn He His Met Lys Asn 

995 1000 1005 

gag age aaa aat ate gat gta aac gtg gat ata aac gat gat gta gat 
Glu Ser Lys Asn He Asp Val Asn Val Asp He Asn Asp Asp Val Asp 
1010 1015 1020 

aaa tat agt gaa gaa tat atg gac gat gat aat ttt ata aaa teg ttt 
Lys Tyr Ser Glu Glu Tyr Met Asp Asp Asp Asn Phe He Lys Ser Phe 
1025 1030 1035 



2810 



2858 



2906 



2954 



3002 



3050 



3098 



3146 



3194 



3242 
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tea att gtt gat atg ata ttt tta aat cct tta gat aaa aat atg ata 
Ser lie Val Asp Met He Phe Leu Asn Pro Leu Asp Lys Asn Met lie 
1105 1110 1115 

gat cat gta ata aaa caa aat aaa cat caa tat tta att act tat gaa 
Asp His Val He Lys Gin Asn Lys His Gin Tyr Leu He Thr Tyr Glu 
1120 1125 1130 1135 

gat aat act ata ggt ggt ttt tct aca cat ttc aat aat tat tta ata 
Asp Asn Thr He Gly Gly Phe Ser Thr His Phe Asn Asn Tyr Leu He 

1140 H45 1150 

gaa aat aat tat att aca aaa cat aac tta tat gtt cat aat att tat 
Glu Asn Asn Tyr He Thr Lys His Asn Leu Tyr Val His Asn He Tyr 

1155 H60 1165 

tta tct aat gag cca att gaa cat gca tct ttt aag gat caa caa gaa 
Leu Ser Asn Glu Pro He Glu His Ala Ser Phe Lys Asp Gin Gin Glu 
1170 H75 1180 

gtc gtc aaa atg gat aaa tgt agt ctt gtc aat aga att aaa aat tat 
Val Val Lys Met Asp Lys Cys Ser Leu Val Asn Arg He Lys Asn Tyr 
1185 H90 1195 

ctt aaa aat aat cct aca tgatgtaaga taaatatata tttctaaaat 



3290 



3338 
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att gga aaa tct aga att att aaa atg gat aat gaa aat aat aat aca 
He Gly Lys Ser Arg He He Lys Met Asp Asn Glu Asn . Asn Asn Thr 
1040 1045 1050 1055 

aat gaa cat tat tea age aga gga gat aca cag aca aaa aaa aaa aaa 
Asn Glu His Tyr Ser Ser Arg Gly Asp Thr Gin Thr Lys Lys Lys Lys 

1060 1065 1070 

gtt tgt ate ttt aac atg ggt agt atg ctt ttt aat gta att aat get 
Val Cys He Phe Asn Met Gly Ser Met Leu Phe Asn Val He Asn Ala 

1075 1080 1085 



ata aaa gaa att gaa aaa gaa caa tat att tea cat aat tat tct ttt 3434 
He Lys Glu He Glu . Lys Glu Gin Tyr He Ser His Asn Tyr Ser Phe 
1090 1095 1100 



3386 



3482 



3530 



3578 



3626 



3674 



3722 



3770 
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Leu Lys Asn Asn Pro Thr 

* * 

1200 1205 

* * * 

tatttttttt ttatacttta atgtgtacaa taaaatatat atctaaatat attttatttg 3830 
tacacttttt tttttttttt tttaattgtt atttttgtat at 3872 



<210> 4 
<211> 1205 
<212> PRT 

<213> Plasmodium falciparum 



<400> 4 

Met lie Phe Asn Tyr Val Phe Phe Lys Asn Phe Val Pro Val Val Leu 
15 10 15 

Tyr He Leu Leu He He Tyr He Asn Leu Ash Gly Met Asn Asn Lys 

20 25 30 

Asn Gin He Lys Thr Glu Lys He Tyr He Lys Lys Leu Asn Arg Leu 

35 40 45 

Ser Arg Lys Asn Ser Leu Cys Ser Ser Lys Asn Lys He Ala Cys Leu 
50 55 60 

Phe Asp He Gly Asn Asp Asp Asn Arg Asn Thr Thr Tyr Gly Tyr Asn 
65 70 75 80 

Val Asn Val Lys Asn Asp Asp He Asn Ser Leu Leu Lys Asn Asn Tyr 

85 90 95 

Ser Asn Lys Leu Tyr Met Asp Lys Arg Lys Asn He Asn Asn Val He 

100 105 HO 

Ser Thr Asn Lys He Ser Gly Ser He Ser Asn He Cys Ser Arg Asn 
115 120 125 

Gin Lys Glu Asn Glu Gin Lys Arg Asn Lys Gin Arg Cys Leu Thr Gin 
130 135 140 

Cys His Thr Tyr Asn Met Ser His Glu Gin Asp Lys Leu Ala Asn Asp 
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145 150 "5 160 

■ 

Asn Asn Arg Asn Asn Lys Lys Asn Phe Asn Leu Leu Phe He Asn Tyr 

165 WO "5 

* 

Phe Asn Leu Lys Arg Met Lys Asn Ser Leu Leu Asn Lys Asp Asn Phe 

180 1*5 190 

Phe Tyr Cys Lys Glu Lys Lys Leu Ser Phe Leu His Lys Ala Tyr Lys 
195 200 205 

Lys Lys Asn Cys - Thr Phe Gin Asn Tyr Ser Leu Lys Arg Lys Ser Asn 
210 215. 220. 

Arg Asp Ser His Lys Leu Phe Ser Gly Glu Phe Asp Asp Tyr Thr Asn 
225 230 235 240 

Asn Asn Ala Leu Tyr Glu Ser Glu Lys Lys Glu Tyr He Thr Leu Asn 

245 250 255 

Asn Asn Asn Lys Asn Asn Asn Asn Lys Asn Asn Asp Asn Lys Asn Asn 

260 265 270 

Asp Asn Asn Asp Tyr Asn Asn Asn Asn Ser Cys Asn Asn Leu Gly Glu 
275 280 285 

Arg Ser Asn His Tyr Asp Asn Tyr Gly Gly Asp Asn Asn Asn Pro Cys 
290 295 300 

Asn Asn Asn Asn Asp Lys Tyr Asp He Gly Lys Tyr Phe Lys Gin He 
305 < 310 315 320 

Asn Thr Phe He Asn He Asp Glu Tyr Lys Thr He Tyr Gly Asp Glu 

325 330 335 

He Tyr Lys Glu He Tyr Glu Leu Tyr Val Glu Arg Asn He Pro Glu 

340 345 350 

Tyr Tyr Glu Arg Lys Tyr Phe Ser Glu Asp He Lys Lys Ser Val Leu 
355 360 365 

Phe Asp He Asp Lys Tyr Asn Asp Val Glu Phe Glu Lys Ala He Lys 
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370 375 380 

Glu Glu Phe lie Asn Asn Gly Val Tyr He Asn Asn lie Asp Asn Thr 
385 390 395 400 

Tyr Tyr Lys Lys Glu Asn He Leu He Met Lys Lys lie Leu His Tyr 

405 410 415 

Phe Pro Leu Leu Lys Leu He Asn Asn Pro Ser Asp Leu Lys Lys Leu 

420 425 430 

Lys Lys Gin Tyr Leu Pro Leu Leu Ala His Glu Leu Lys He Phe Leu 
435 . 440 445 

Phe Phe He Val Asn He Thr Gly Gly His Phe Ser Ser Val Leu Ser 
450 455 460 

Ser Leu Glu He Gin Leu Leu Leu Leu Tyr He Phe Asn Gin Pro Tyr 
465 470 475 480 

Asp Asn Val He Tyr Asp He Gly His Gin Ala Tyr Val His Lys He 

485 490 495 

Leu Thr Gly Arg Lys Leu Leu Phe Leu Ser Leu Arg Asn Lys Lys Gly 

500 505 510 

lie Ser Gly Phe Leu Asn He Phe Glu Ser He Tyr Asp Lys Phe Gly 
515 520 525 

Ala Gly His Ser Ser Thr Ser Leu Ser Ala He Gin Gly Tyr Tyr Glu 
530 535 540 

.-.ia Glu Trp Gin Val Lys Asn Lys Glu Lys Tyr Gly Asn Gly Asp lie 
545 550 555 560 

Glu lie Ser Asp Asn Ala Asn Val Thr Asn Asn Glu Arg He Phe Gin 

565 570 575 

Lys Gly He His Asn Asp Asn Asn He Asn Asn Asn lie Asn Asn Asn 

580 585 590 

Asn Tyr He Asn Pro Ser Asp Val Val Gly Arg Glu Asn Thr Asn Val 
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595 600 605 

* i * 

Pro Asn Val Arg Asn Asp Asn His Asn Val Asp Lys Val His lie Ala 

■ 

610 615 620 

He He Gly Asp Gly Gly Leu Thr Gly Gly Met Ala Leu Glu Ala Leu 
625 630 635 640 

Asn Tyr He Ser Phe Leu Asn Ser Lys He Leu He lie Tyr Asn Asp 

645 650 655 

Asn Gly Gin Val Ser Leu Pro Thr Asn Ala Val Ser He Ser Gly Asn 

660 665 670 

Arg Pro He Gly Ser He Ser Asp His Leu His Tyr Phe Val Ser Asn 
675 680 685 

He Glu Ala Asn Ala Gly Asp Asn Lys Leu Ser Lys Asn Ala Lys Glu 
690 695 700 

Asn Asn He Phe Glu Asn Leu Asn Tyr Asp Tyr He Gly Val Val Asn 
105 710 715 720 

Gly Asn Asn Thr Glu Glu Leu Phe Lys Val Leu Asn Asn He Lys Glu 

725 ^30 735 

Asn Lys Leu Lys Arg Ala Thr Val Leu His Val Arg Thr Lys Lys Ser 

740 745 750 

Asn Asp Phe He Asn Ser Lys Ser Pro He Ser He Leu His Ser He 
755 7 60 765 

Lys Lys Asn Glu lie Phe Pro Phe Asp Thr Thr lie Leu Asn Gly Asn 
770 775 780 

lie His Lys Glu Asn Lys He Glu Glu Glu Lys Asn Val Ser Ser Ser 
785 790 795 800 

Thr Lys Tyr Asp Val Asn Asn Lys Asn Asn Lys Asn Asn Asp Asn Ser 

805 810 815 

Glu He He Lys Tyr Glu Asp Met Phe Ser Lys Glu Thr Phe Thr Asp 
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B20 825 830 

He Tyr Thr Asn Glu Met Leu Lys Tyr Leu Lys Lys Asp Arg Asa He 
835 840 845 

■ 

•ie Phe Leu Ser Pro Ala Met Leu Gly Gly Ser Gly Leu Val Lys lie 
850 855 860 

Ser Glu Arg Tyr Pro Asn Asn Val Tyr Asp Val Gly lie Ala Glu Gin 
865 870 875 880 

His Ser Val Thr Phe Ala Ala Ala Met Ala Met Asn Lys Lys Leu Lys 

885 890 895 

lie Gin Leu Cys lie Tyr Ser Thr Phe Leu Gin Arg Ala Tyr Asp Gin 

900 905 910 

lie He His Asp Leu Asn Leu Gin Asn lie Pro Leu Lys Val He He 
915 920 925 

Gly Arg Ser Gly Leu Val Gly Glu Asp Gly Ala Thr His Gin Gly He 
930 935 940 

Tyr Asp Leu Ser Tyr Leu Gly Thr Leu Asn Asn Ala Tyr He He Ser 
945 950 . 955 960 

Pro Ser Asn Gin Val Asp Leu Lys Arg Ala Leu Arg Phe Ala Tyr Leu 

965 970 975 

Asp Lys Asp His Ser Val Tyr He Arg He Pro Arg Met Asn He Leu 

980 985 990 

■ 

Ser Asp Lys Tyr Met Lys Gly Tyr Leu Asn He His Met Lys Asn Glu 
995 . 1000 1005 

Ser Lys Asn He Asp Val Asn Val Asp He Asn Asp Asp Val Asp Lys 
1010 1015 1° 20 

Tyr Ser Glu Glu Tyr Met Asp Asp Asp Asn Phe He Lys Ser Phe He 
025 1030 1035 1040 

Gly Lys Ser Arg He He Lys Met Asp Asn Glu Asn Asn Asn Thr Asn 
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1045 



1050 



1055 



Glu His Tyr Ser Ser Arg Gly Asp Thr Gin Thr Lys Lys Lys Lys Val 

1060 1065 1070 

Cys lie Phe Asn Met Gly Ser Met Leu Phe Asn Val He Asn Ala He. 
1075 1080 1085 

Lys Glu He Glu Lys Glu Gin Tyr He Ser His Asn Tyr Ser Phe Ser 
1090 1095 noo 

He Val Asp Met He Phe Leu Asn Pro Leu Asp Lys Asn Met lie Asp 
105 ~ 1110 U15 1120 

His Val He Lys Gin Asn Lys His Gin Tyr Leu lie Thr Tyr Glu Asp 

1125 H30 1135 

Asn Thr He Gly Gly Phe Ser Thr His Phe Asn Asn Tyr Leu He Glu 

1140 H45 H50 

Asn Asn Tyr lie Thr Lys His Asn Leu Tyr Val His Asn He Tyr Leu 
1155 1160 H65 

Ser Asn Glu Pro He Glu His Ala Ser Phe Lys Asp Gin Gin Glu Val 
1170 H75 H80 

Val Lys Met Asp Lys Cys Ser Leu Val Asn Arg lie Lys Asn Tyr Leu 
185 1190 H95 1200 



Lys Asn Asn Pro Thr 

1205 



<210> 5 
<211> 3147 
<212> DNA 

<213> Plasmodium falciparum 

<220> 
<221> CDS 

<222> (199) . . (2670) 
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* 

* 

<400> 5 

tttcattttt ctttacccac atatatatat atatatatat aatatatata tataatatta 60 
tatatttgat atatgattta aaattgtaac ataaaaaaaa taattatatt aaatatgtgt 120 



ata 



catctcc aacatataaa tattattttt tattattatt tttttttttt tttttcataa 180 



tgcctgaata accacaaa atg agt tat ata aaa aga ctg att ctt ttt atg 231 

Met Ser Tyr lie Lys Arg Leu lie Leu Phe Met 
1 5 10 



tta ctg ttt tat tct cat gta aaa att aaa aaa tta ttt att aaa att 
Leu Leu Phe Tyr Ser His Val Lys lie Lys Lys Leu Phe lie Lys He 

15 20 25 

tct aat gta aac ata ttt ttt gca gaa gca aag aaa aat gga aaa aag 
Ser Asn Val Asn He Phe Phe Ala Glu Ala Lys Lys Asn Gly Lys Lys 

30 35 40 

gaa ttc ttt ctt ttt tta eta aat ata aaa aaa aat age caa cag aaa 
Glu Phe Phe Leu Phe Leu Leu Asn He Lys Lys Asn Ser Gin Gin Lys 
45 50 55 

aaa act tat cat att acc aaa agg aat acc ata aat aaa agt gat ttt 
Lys Thr Tyr His He Thr Lys Arg Asn Thr He Asn Lys Ser Asp Phe 
60 65 70 75 

tta tat tct tta eta aat gaa gaa ggg aat tct tea aaa aag gaa tat 
Leu Tyr Ser Leu Leu Asn Glu Glu Gly Asn Ser Ser Lys Lys . Glu Tyr 

80 85 90 

aaa aat tta aaa gat gaa gaa aaa tat aat ate ata caa aat ata aaa 
Lys Asn Leu Lys Asp Glu Glu Lys Tyr Asn He He Gin Asn He Lys 

95 100 105 

aaa tat tgt gaa tgt act aaa aaa tat aaa agg etc cca aca cga gaa 
Lys Tyr Cys Glu Cys Thr Lys Lys Tyr Lys Arg Leu Pro Thr Arg Glu 
U0 H5 I 20 

gta gtt att gga aat gtt aaa att gga gga aat aat aaa ata get att 
Val Val He Gly Asn Val Lys He Gly Gly Asn Asn Lys He Ala He 



279 



327 



375 



423 



471 



519 



567 



615 
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130 



135 



caa act atg get age tgt gat aca aga aat gta gaa gaa tgt gta tat 
Gin Thr Met Ala Ser Cys Asp Thr Arg Asn Val Glu Glu Cys Val Tyr 
140 145 150 155 



663 



caa att aga aaa tgt aaa gat ttg ggt get gac att gta agg ttg act 
Gin lie Arg Lys Cys Lys Asp Leu Gly Ala Asp lie Val Arg Leu Thr 

160 165 170 



711 



get caa gga gtt caa gaa gca caa get agt tat cat att aaa gaa aaa 
Val Gin Gly Val Gin Glu Ala Gin Ala Ser Tyr His lie Lys Glu Lys 

175 180 185 



759 



tta tta tct gaa aat gta. aat ate cca tta gta gca gat att cat ttt 
Leu Leu Ser Glu Asn Val Asn lie Pro Leu Val Ala Asp lie His Phe 
190 195 200 



807 



aat cct aaa ata get tta atg gca get gat gtg ttt gaa aaa .att cga 
Asn Pro Lys lie Ala Leu Met Ala Ala Asp Val Phe Glu Lys lie Arg 
205 210 215 



855 



gtg aat cca gga aat tat gtt gat gga aga aaa aaa tgg ata gat aaa 
Val Asn Pro Gly Asn Tyr Val Asp Gly Arg Lys Lys Trp He Asp Lys 
220 225 230 235 



903 



gtt tat aaa act aaa gaa gaa ttc gac gaa ggg aaa tta ttt ata aaa 
Val Tyr Lys Thr Lys Glu Glu Phe Asp Glu Gly Lys Leu Phe He Lys 

240 245 250 



951 



gaa aaa ttt gta cca tta att gaa aaa tgt aaa aga tta aat aga gca 
Glu Lys Phe Val Pro Leu He Glu Lys Cys Lys Arg Leu Asn Arg Ala 

255 260 265 



999 



ata aga att gga aca aat cat gga tec ctt tea tct cga gta tta tea 
He Arg He Gly Thr Asn His Gly Ser Leu Ser Ser Arg Val Leu Ser 
270 275 280 



1047 



tat tat gga gat aca cca tta ggt atg gta gaa teg get ttt gag ttt 
Tyr Tyr Gly Asp Thr Pro Leu Gly Met Val Glu Ser Ala Phe Glu Phe 
285 290 295 



1095 
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tct gat tta tgt att gaa aac aat ttt tac aat ctt gtt ttt tct atg 
Ser Asp Leu Cys lie Glu Asn Asn Phe Tyr Asn Leu Val Phe Ser Met 
300 305 310 315 



1143 



aaa get tct aat get tat gtt atg ata caa tct tat aga tta tta gta 
Lys Ala Ser Asn Ala Tyr Val Met lie Gin Ser Tyr Arg Leu Leu Val 

320 325 330 



1191 



tct aaa caa tat gaa aga aat atg atg ttc cct ata cat tta gga gtt 
Ser Lys Gin Tyr Glu Arg Asn Met Met Phe Pro He His Leu Gly Val 

335 340 345 



1239 



aca gaa gca gga ttt ggt gat aat gga aga ata aaa tct tat tta ggt 
Thr Glu Ala Gly Phe Gly Asp Asn Gly Arg He Lys Ser Tyr Leu Gly 
350 355 360 



1287 



ata gga tct tta tta tat gat ggt ata gga gat acc att cgt ata tec 
He Gly Ser Leu Leu Tyr Asp Gly He Gly Asp Thr He Arg He Ser 
365 370 375 



1335 



tta aca gaa gat cct tgg gaa gag tta act cct tgt aaa aaa tta gtt 
Leu Thr Glu Asp Pro Trp Glu Glu Leu Thr Pro Cys Lys Lys Leu Val 
380 385 390 395 



1383 



gaa aat tta aag aaa aga ata ttt tat aat gaa aat ttt aaa gaa gat 
Glu Asn Leu Lys Lys Arg He Phe Tyr Asn Glu Asn Phe Lys Glu Asp 

400 405 410 



1431 



aat gaa tta aaa aat aat gaa atg gat acc aaa aat eta tta aat ttt 
Asn Glu Leu Lys Asn. Asn Glu Met Asp Thr Lys Asn Leu Leu Asn Phe 

415 420 425 



1479 



gaa gaa aat tat cga aat ttt aat aat ata aaa aaa aga aat gta gaa 
Glu Glu Asn Tyr Arg Asn Phe Asn Asn He Lys Lys Arg Asn Val Glu 
430 4 35 44 0 



1527 



aaa aat aat aat gta tta cat gaa gag tgc act ata ggt aat gta gta ' 
Lys Asn Asn Asn Val Leu His Glu Glu Cys Thr lie Gly Asn Val Val 
445 450 4 55 



1575 



acc ata aaa gag tta gaa gat tct ctg caa att ttt aaa gat tta aat 
Thr He Lys Glu Leu Glu Asp Ser Leu Gin He Phe Lys Asp Leu Asn 



1623 
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460 



465 



24 
470 



475 



tta gaa gta gat tea aat gga aat ttg aaa aag gga gec aaa aca act 
Leu Glu Val Asp Ser Asn Gly Asn Leu Lys Lys Gly Ala Lys Thr Thr 

480 485 490 



1671 



gat atg gtt att ata aat gat ttt cat aat ata aca aat tta gga aaa 
Asp Met Val He He Asn Asp Phe His Asn He Thr Asn Leu Gly Lys 

495 500 505 



1719 



aaa act gtg gat aaa tta atg caa gtg gga att aat ata gta gtt caa 
Lys Thr Val Asp Lys Leu Met Gin Val Gly He Asn He Val Val Gin 
510 515 .. 520 



1767 



tat gaa cca cat aat ata .gaa ttt ata gaa aaa atg gaa cca aat aat 
Tyr Glu Pro His Asn He Glu Phe He Glu Lys Met Glu Pro Asn Asn 
525 530 535 



1815 



gat aat aat aat aat aat aat aat aat aat ata tta ttt tat gtg gat 
Asp Asn Asn Asn Asn Asn Asn Asn Asn Asn He Leu Phe Tyr Val Asp 
540 545 550 555 



1863 



ata aaa aat att atg aac agt tea gaa aaa aat att aaa tta agt aat 
He Lys Asn He Met Asn Ser Ser Glu Lys Asn He Lys Leu Ser Asn 

560 565 570 



1911 



tct aaa gga tat gga tta att tta aac gga aaa gaa gat ata caa acc 
Ser Lys Gly Tyr Gly Leu He Leu Asn Gly Lys Glu Asp lie Gin Thr 

575 580 585 



1959 



ata aaa aaa ata aaa gaa tta aat cgt cgt cct tta ttc att eta tta 
He Lys Lys He Lys Glu Leu Asn Arg Arg Pro Leu Phe He Leu Leu 
590 595 600 



2007 



aaa tea gat aac ata tat gaa cat gta tta ata acc aga aga att aat 
Lys Ser Asp Asn He Tyr Glu His Val Leu lie Thr Arg Arg He Asn 
605 610 615 



2055 



gaa ctt tta caa tec tta aat ata aat ata cct tat ata cat tat gtt 
Glu Leu Leu Gin Ser Leu Asn He Asn He Pro Tyr He His Tyr Val 
620 625 630 635 



2103 
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gat att aat tea aac aat.tat gat gat ata tta gtt aat tea aca tta 2151 
Asp lie Asn Ser Asn Asn Tyr Asp Asp He Leu Val Asn Ser Thr Leu 

640 ««» 650 



tat gca gga agt tgt ttg atg gat tta atg ggg gat ggt ctt att gtt 
Tyr Ala Gly Ser Cys Leu Met Asp Leu Met Gly Asp Gly Leu He Val 

655 6«0 665 

aac gta act aat gat gtt ctt aca aat aaa aaa aag ata gaa aca aaa 
Asn Val Thr Asn Asp Val Leu Thr Asn. Lys Lys Lys He Glu Thr Lys 
670 675 680 



cat aga ctt ttg age aga gtt gca tta aat tea ttt tta aca tta 
His Arg Leu Leu Ser Arg Val Ala Leu Asn Ser Phe Leu Thr Leu Asn 
700 705 710 715 

att tta caa gat aca aga ata cgt tta ttt aaa aca gat tat ata gec 
He Leu Gin Asp Thr Arg He Arg Leu Phe Lys Thr Asp Tyr He Ala 

720 725 730 

tgc cca tct tgt gga aga act tta ttt aat ata caa gaa act act aaa 
Cys Pro Ser Cys Gly Arg Thr Leu Phe Asn He Gin Glu Thr Thr Lys 

735 740 745 

aaa att atg aaa tta aca ggg cac tta aaa ggc gtt aaa att gca gtc 
Lys He Met Lys Leu Thr Gly His Leu Lys Gly Val Lys He Ala Val 
150 755 760 

atg gga tgt att gtt aat ggt ata gga gaa atg gca gat gca cat ttt 
Met Gly Cys He Val Asn Gly He Gly Glu Met Ala Asp Ala His Phe 
765 770 775 

ggt tat gtt ggt agt gca cct aaa aaa att gat tta tat tat ggt aaa 
Gly Tyr Val Gly Ser Ala Pro Lys Lys He Asp Leu Tyr Tyr Gly Lys 
780 785 790 795 

gag tta gta gaa aga aat ata cct gag gaa gaa get tgt gat aaa ttg 
Glu Leu Val Glu Arg Asn He Pro Glu Glu Glu Ala Cys Asp Lys Leu 



2199 



2247 



tat gat gaa aaa gaa gaa gta gag gaa gag gga aac aat aaa gat att 2295 
Tyr Asp Glu Lys Glu Glu Val Glu Glu Glu Gly Asn Asn Lys Asp He 
685 690 695 



2343 



2391 



2439 



2487 



2535 



2583 



2631 
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800 805 26 810 

r 

ata gaa tta att aaa aaa cat aac aaa tgg aaa gat cca taaattgaat 2680 

He Glu Leu He Lys Lys His Asn Lys Trp Lys Asp Pro 

815 820 



a 



tggacaagt atttatttat ttatttatct tatatataat atattataaa tttttcgatg 2740 



tatttttcct tttaaaattt tatttttttt ttattttttt ttttgaagta atatttataa 2800 
tgcatacata atattaaaat gtgtattata taataatatc attttattgt tattttaaaa 2860 
gactaatacc aagaacaatt ttttaataat cattcttata acttgttaaa tatatatata 2920 
tatatatata tatttattta tttatattta tatttattta tttttggtat atgaaaagta 2980 



aaaa 



tataat aatttaaaag tatttacaaa ataaataata ttatatatct gtttttatat 3040 



atatgttaat ggaaaaggag aaaataaata aataaaacaa acaaaataac atatatatat 3100 
atatatatat actgaatgag aaagaaaaaa aaaagaaaag gatacga 3147 



<210> 6 
<211> 824 
<212> PRT 

<213> Plasmodium falciparum 
<400> 6 

Met Ser Tyr He Lys Arg Leu He Leu Phe Met Leu Leu Phe Tyr Ser 
15 10 15 

His Val Lys He Lys Lys Leu Phe He Lys He Ser Asn Val Asn He 

20 25 30 

Phe Phe Ala Glu Ala Lys Lys Asn Gly Lys Lys Glu Phe Phe Leu Phe 

35 40 45 

Leu Leu Asn He Lys Lys Asn Ser Gin Gin Lys Lys Thr Tyr His He 
50 55 60 

Thr Lys Arg Asn Thr He Asn Lys Ser Asp Phe Leu Tyr Ser Leu Leu 
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65 



70 



27 
75 



80 



Asn Glu Glu Gly Asn Ser 

85 



Lys Lys Glu Tyr Lys Asn Leu Lys Asp 

90 95 



Glu Glu Lys Tyr Asn lie He Gin Asn lie Lys Lys Tyr Cys Glu Cys 

100 105 HO 

Thr Lys Lys Tyr Lys Arg Leu Pro Thr Arg Glu Val Val He Gly Asn 
115 120 125 

Val Lys He Gly Gly Asn Asn Lys He Ala lie Gin Thr Met Ala Ser 
130 135 140 

* 

Cys Asp Thr Arg Asn Val Glu Glu Cys Val Tyr Gin He Arg Lys Cys 
145 ISO 155 160 

Lys Asp Leu Gly Ala Asp He Val Arg Leu Thr Val Gin Gly Val Gin 

165 "0 175 

Glu Ala Gin Ala Ser Tyr His He Lys Glu Lys Leu Leu Ser Glu Asn 

180 185 190 

Val. Asn He Pro Leu Val Ala Asp He His Phe Asn Pro Lys He Ala 
195 200 205 

• * 

Leu Met Ala Ala Asp Val Phe Glu Lys He Arg Val Asn Pro Gly Asn 
210 215 220 



Tyr Val Asp Gly Arg Lys Lys Trp He Asp Lys Val Tyr Lys Thr Lys 

235 240 



225 



230 



Glu Glu Phe Asp Glu Gly Lys Leu Phe He Lys Glu Lys Phe Val Pro 

245 250 255 



Leu He Glu Lys Cys Lys Arg Leu Asn Arg Ala He Arg He Gly Thr 

260 265 270 

Asn His Gly Ser Leu Ser Ser Arg Val Leu Ser Tyr Tyr Gly Asp Thr 
275 280 285 

* 

Pro Leu Gly Met Val Glu Ser Ala Phe Glu Phe Ser Asp Leu Cys He 
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290 295 300 

• * 

Glu Asn Asn Phe Tyr Asn Leu Val Phe Ser Met Lys Ala Ser Asn Ala 
305 310 315 320 

* 

Tyr Val Met He Gin Ser Tyr Arg Leu Leu Val Ser Lys Gin Tyr Glu 

325 330 335 

Arg Asn Met Met Phe Pro He His Leu Gly Val Thr Glu Ala Gly Phe 

340 345 350 

Gly Asp Asn Gly Arg He Lys Ser Tyr Leu Gly lie Gly Ser Leu Leu 
355 360 365 

Tyr Asp Gly lie Gly Asp Thr He Arg He Ser Leu Thr Glu Asp Pro 
370 375 380 

Trp Glu Glu Leu Thr Pro Cys Lys Lys Leu Val . Glu Asn Leu Lys Lys 
385 390 395 400 

Arg He Phe Tyr Asn Glu Asn Phe Lys Glu Asp Asn Glu Leu Lys Asn 

405 410 415 

Asn Glu Met Asp Thr Lys Asn Leu Leu Asn Phe Glu Glu Asn Tyr Arg 

420 425 430 

Asn Phe Asn Asn He Lys Lys Arg Asn Val Glu Lys Asn Asn Asn Val 
435 440 445 

Leu His Glu Glu Cys Thr He Gly Asn Vai Val Thr He Lys Glu Leu 
450 455 460 

Glu Asp Ser Leu Gin He Phe Lys Asp Leu Asn Leu Giu Val Asp Ser 
465 470 475 480 

Asn Gly Asn Leu Lys Lys Gly Ala Lys Thr Thr Asp Met. Val He He 

485 490 495 

Asn Asp Phe His Asn He Thr Asn Leu Gly Lys Lys Thr Val Asp Lys 

500 505 510 

Leu Met Gin Val Gly He Asn He Val . Val Gin Tyr Glu Pro His Asn 
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* * 

515 520 

* * * 

He Glu Phe He Glu Lys Met Glu Pro Asn Asn Asp Asn Asn Asn Asn 
530 535 540 

■ » 

Asn Asn Asn Asn Asn lie Leu Phe Tyr Val Asp He Lys Asn He Met 
545 550 555 560 

Asn Ser Ser Glu Lys Asn He Lys Leu Ser Asn Ser Lys Gly Tyr Gly 

565 570 575 

Leu He Leu Asn Gly Lys Glu Asp He Gin Thr He Lys Lys He Lys 

580 585 590 

* 

Glu Leu Asn Arg Arg Pro Leu Phe He Leu Leu Lys Ser Asp Asn He 
595 600 605 

Tyr Glu His Val Leu He Thr Arg Arg He Asn Glu Leu Leu Gin Ser 
610 615 620 

Leu Asn He Asn He Pro Tyr He His Tyr Val Asp He Asn Ser Asn 
625 630 635 640 

Asn Tyr Asp Asp He Leu Val Asn Ser Thr Leu Tyr Ala Gly Ser Cys 

645 650 655 

Leu Met Asp Leu Met Gly Asp Gly Leu lie Val Asn Val Thr Asn Asp 

660 665 670 

Val Leu Thr Asn Lys Lys Lys He Glu Thr Lys Tyr Asp Glu Lys Glu 
675 680 685 

Glu Val Glu Glu Glu Gly Asn Asn Lys Asp He His Arg Leu Leu Ser 
690 695 700 

Arg Val Ala Leu Asn Ser Phe Leu Thr Leu Asn He Leu Gin Asp Thr 
705 710 71S 720 

Arg He Arg Leu Phe Lys Thr Asp Tyr He Ala Cys Pro Ser Cys Gly 

725 "0 735 

Arg Thr Leu Phe Asn He Gin Glu Thr Thr Lys Lys He Met Lys Leu 
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